理解「權」與加權平均數
一般而言,若 $n$ 個數 $x_1, x_2, \cdots, x_n$ 的權分別為 $w_1, w_2, \cdots, w_n$,則:
$\frac{x_1w_1+x_2w_2+\cdots+x_nw_n}{w_1+w_2+\cdots+w_n}$
稱為這 $n$ 個數的加權平均數(weighted average)。權(weight),代表數據的重要程度。權越大,該部分數據對最終平均數的影響力就越強(如同物理天平上較重的砝碼會使支點靠近它)。
假設選手A在內容上得分極高,但在舞台效果上稍弱。若採用「算術平均」,他可能與各項平庸的選手B同分;但若對「內容」賦予0.5的權重,對「效果」賦予0.2的權重,選手A的加權成績便因核心能力突出而勝出。加權平均數真實反映了選拔人才時的具體價值取向。
頻數作為權:處理群集數據
在統計大規模數據時(例如「例6 商場服裝部」營業員的月銷售額,或跳水隊運動員的年齡調查),相同的數值會多次出現。此時,出現的次數(頻數)自然成為該數值的權。
在求 $n$ 個數的平均數時,若 $x_1$ 出現 $f_1$ 次,$x_2$ 出現 $f_2$ 次,$\cdots$,$x_k$ 出現 $f_k$ 次(其中 $f_1+f_2+\cdots+f_k=n$),則這 $n$ 個數的平均數:
$\bar{x} = \frac{x_1f_1+x_2f_2+\cdots+x_kf_k}{n}$
也稱為這 $k$ 個數的加權平均數,其中 $f_1, f_2, \cdots, f_k$ 分別稱為 $x_1, x_2, \cdots, x_k$ 的權。透過此方式計算出的月銷售目標,可過濾個別極端高銷量的干擾,真實反映大多數營業員的普遍實力,從而制定出兼具挑戰性與可行性的獎勵制度。
組中值的智慧折衷
當數據被粗略分配至不同區間(數據分組)時,我們失去個體的具體數值。此時,一個小組的組中值是指該小組兩個端點數值的平均數。例如將區間中點與該區間的頻數相乘,即形成經典的加權計算模式:
$\bar{x} = \frac{11 \times 3 + 31 \times 5 + 51 \times 20 + 71 \times 22 + 91 \times 18 + 111 \times 15}{3+5+20+22+18+15}$